AI资讯新闻榜单内容搜索-GPT-5

3B小模型，编程得分比肩Opus 4.5，神秘模型引发热议，原是国产

最近几天，一个 3B 的小模型在 X 上火了，因为在一些难度可验证的推理任务上（比如编程），它进入了 Gemini 3 Pro、GPT-5 high、Claude Opus 4.5、GLM-5、Kimi K2.5 等前沿模型的性能区间，而它的体积远小于这些模型。

来自主题: AI技术研报

10137 点击 2026-06-18 15:30

2026 年初，各大 AI 厂商在上下文窗口长度上展开激烈角逐。Google 的 Gemini 3 Pro 已支持 100 万级 token 上下文，Meta 的 Llama 4 Scout 更宣称可处理 1000 万 token。GPT-5 系列也在快速推进长上下文能力。

来自主题: AI技术研报

10107 点击 2026-06-02 11:23

凌晨，OpenAI 发布 GPT-5.5，是 GPT-5 系列迄今最大更新

来自主题: AI技术研报

7916 点击 2026-04-24 10:13

你见过 7B 模型在拼图推理上干翻 GPT-5 吗？

来自主题: AI技术研报

7124 点击 2026-03-04 11:18

今日凌晨，比OpenAI早一个小时，谷歌甩出了3个Agent大招：Deep Research Agent功能更新，并首次向开发者开放；开源新网络研究Agent基准DeepSearchQA，旨在测试Agent在网络研究任务中的全面性；推出新交互API（Interactions API）。

来自主题: AI资讯

9875 点击 2025-12-12 08:14

最近，小编注意到一位全栈工程师 Rohith Singh 在Reddit上发表了一篇帖子，介绍他如何对四个模型（Kimi K2 Thinking、Sonnet 4.5、GPT-5 Codex 和 GPT-5.1 Codex）进行了实测。

来自主题: AI资讯

10151 点击 2025-11-18 15:10

刚刚，为期两周的 AI 投资大乱斗收官。

来自主题: AI资讯

8854 点击 2025-11-04 17:32

尽管今天还有 Sora 角色客串功能和 GPT-5 查找和修复安全漏洞智能体的消息，但本文的重点是深扒 Atlas 背后的「灵魂」—— OWL 架构。看看 OpenAI 究竟是如何驯服 Chromium，把它从浏览器「换皮」玩成了「架构重组」的。

来自主题: AI资讯

9205 点击 2025-10-31 11:38

智东西10月15日报道，今日，阿里通义千问团队推出其最强视觉语言模型系列Qwen3-VL的4B与8B版本，两个尺寸均提供Instruct与Thinking版本，在几十项权威基准测评中超越Gemini 2.5 Flash Lite、GPT-5 Nano等同级别顶尖模型。

来自主题: AI资讯

11529 点击 2025-10-15 17:05

模型众多，该如何选择？ GPT-5：OpenAI的最新旗舰模型，统一智能系统，GPT-5 集成了多个模型，自动根据任务复杂度选择最适合的模型进行处理，多模态首选。 GPT-5 Thinking：GPT

来自主题: AI产品测评

14394 点击 2025-10-15 12:29